【Java笔记】多线程1:线程池大小为什么设置N+1或2N?CPU密集型?IO密集型? |
您所在的位置:网站首页 › cpu密集 io密集 › 【Java笔记】多线程1:线程池大小为什么设置N+1或2N?CPU密集型?IO密集型? |
经典面试题:线程池设置多大合适
文章目录
经典面试题:线程池设置多大合适1. N1.1 什么是N1.2 如何查看N
2. IO密集型运算与CPU密集型运算3. 为什么是2N?又为什么是N+1?3.1 为什么IO密集型运算最大线程数是2N?3.2 为什么CPU密集型运算的最大线程数是N+1
Reference
大家都知道这个问题需要根据不同场景来回答:
CPU密集型运算:N+1IO密集型运算:2N
那么,就有几个问题: N是什么?什么是IO密集型运算?什么又是CPU密集型运算?为什么是2N?又为什么是N+1?下面就稍微梳理下 1. N 1.1 什么是N需要注意的是,N是最大并行数,而不是“X核CPU”的X。 一般我们会听到例如“4核8线程”的说法,这里的8就是N,虽然只有4个CPU(核心),但是可以利用超线程技术把原来CPU4个线程虚拟成8个。 1.2 如何查看N Runtime.getRuntime().availableProcessors();会返回计算机的最大并行数 2. IO密集型运算与CPU密集型运算 IO密集型运算:就是指需要频繁输入输出的场景,这里的IO不仅包括操作数据库时的磁盘-内存IO,也包括网络远程调用的IO。CPU密集型运算:CPU运算需求高的场景,比如循环次数很多,或者递归调用层次很深等 3. 为什么是2N?又为什么是N+1?首先要明确,2N跟N+1都是经验值,大家能明白大概的逻辑就行 3.1 为什么IO密集型运算最大线程数是2N?这个有一个公式: 理想线程数=最大并行数*期望CPU利用率*(CPU计算时间+等待时间)/CPU计算时间 下面我们试图理解一下。首先先明公式里几个变量的意义: 最大并行数:就是前面说的N期望CPU利用率:最理想的情况肯定是希望利用率100%(发热严重?那不管我事)CPU计算时间:就是字面意思等待时间:等待数据IO的时间首先要明确,在涉及大量数据IO的场景下,CPU利用率最高的时候是什么时候?肯定是当任务A在等待IO时,CPU可以切到任务B进行CPU运算,保证CPU不会因为等待IO而停下来。 因此会有 最大并行数*(CPU计算时间+等待时间)/CPU计算时间 如果理想地认为CPU计算时间等于等待时间,那么就是2N了。 当然大部分场景下这是不可能的,一般Web项目中IO时间,也就是上面说的CPU等待时间,都远高于CPU处理时间(因此MySQL才会用B+树做索引来减小每查找一层增加的IO)。比如一个简单的数据库查询,计算可能只有0.1ms,IO则可能达到2ms,这样一算,得21N了。所以2N只是个理想的经验值,在高IO时间开销的场景,可以是10N、20N、30N等等。 3.2 为什么CPU密集型运算的最大线程数是N+1回到我们的出发点:希望CPU一刻不停的工作。 CPU密集型运算场景下,我们就不再考虑IO了。这时候CPU空闲的原因一般就是正在处理的任务出现错误,暂停了。这个时候如果我们有另一个任务恰好补上来,那CPU就没得歇了。所以是N+1。当然这也是经验值。 网上也有说法是,CPU密集型运算的最大线程数可以设置在N~2N,这个也不难理解,如果我们N个实际线程都在处理任务,他们发生了错误,每个都有个替补的补上,这就是2N了。 但1.5N或者2N之类比较大的线程数也不一定是最好的,前面的一切分析都是基于“提高CPU利用率”这个目的,但是不一定代表速度就快,对于任务失败可能性比较低的场景,设2N属于纯粹没事找事,因为并不需要这么多候补的任务,多出来的一起排队反而是给缓存上强度,上下文切换的时候开销更大了(大概)。之前由朋友做课程实验,是起多个线程并行做矩阵运算,发现其实N是最快的,因为矩阵运算失败可能性很小。 Referencehttps://blog.csdn.net/Cover_sky/article/details/121371973 https://cloud.tencent.com/developer/article/1730603 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |